home *** CD-ROM | disk | FTP | other *** search
/ MacWorld 1998 January / Macworld (1998-01).dmg / Shareware World / Comms & Internet / Convert Cyrillic HTML 2.1 / For use with Add⁄Strip / Read me first < prev    next >
Text File  |  1997-09-30  |  3KB  |  81 lines

  1. Convert Cyrillic HTML files with Add/Strip
  2. v. 2.1
  3.  
  4.  
  5.  
  6. These “settings files” are intended for use with Add/Strip™ (info-mac/text/add-strip-322.hqx  at any Info-Mac mirror <news:comp.sys.mac.digest>). They enable you to convert Cyrillic HTML files between different character sets used on the Internet <http://www.fingertipsoft.com/ref/cyrillic/charsets.html>, namely:
  7.  
  8. • MacCyrillic
  9. <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/CYRILLIC.TXT>
  10. <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/APPLE/UKRAINE.TXT>
  11.  
  12. • ISO-IR-111  (commonly known as KOI-8 or KOI8 and most widely used for Russian and Ukrainian)
  13. <ftp://dkuug.dk/i18n/charmaps/ECMA-CYRILLIC>
  14. <http://www.fingertipsoft.com/ref/cyrillic/isoir111.html>
  15.  
  16. • ISO-8859-5  (= ISO-IR-144)
  17. <ftp://ftp.unicode.org/Public/MAPPINGS/ISO8859/8859-5.TXT>
  18.  
  19. • Windows-1251  (i.e. Code Page 1251)
  20. <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP1251.TXT>
  21.  
  22. • IBM866  (i.e. Code Page 866)
  23. <ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/PC/CP866.TXT>
  24.  
  25. • Unicode
  26. <http://www.unicode.org/>
  27.  
  28. Thereby you need to write your Cyrillic HTML files only with “native” Macintosh fonts but you can present them on the WWW in other encodings. Please note that these settings files do not convert text files into HTML files. They just change the encoding of the Cyrillic characters using Unicode as an intermediate.
  29.  
  30.  
  31. What to do?
  32.  
  33. (1)  Start Add/Strip by opening the appropriate settings file in the Finder:
  34.  
  35. • “MacCyrillic –> Unicode# html”
  36.  
  37. • “ISO-IR-111 –> Unicode# html”
  38.  
  39. • “ISO-8859-5 –> Unicode# html”
  40.  
  41. • “Windows-1251 –> Unicode# html”
  42.  
  43. • “IBM866 –> Unicode# html”
  44.  
  45. Convert HTML files from MacCyrillic, ISO-IR-111 (KOI-8), ISO-8859-5, Windows-1251, or IBM866 to Unicode. All non-ASCII characters are converted to the form “А” — except that the box drawing characters from IBM866 drop out.
  46.  
  47. • “Unicode# –> MacCyrillic html”
  48.  
  49. • “Unicode# –> ISO-IR-111 html”
  50.  
  51. • “Unicode# –> ISO-8859-5 html”
  52.  
  53. • “Unicode# –> Windows-1251 html”
  54.  
  55. • “Unicode# –> IBM866 html”
  56.  
  57. Convert HTML files from Unicode (written in the form “А”) to MacCyrillic, ISO-IR-111 (KOI-8), ISO-8859-5, Windows-1251, or IBM866.
  58.  
  59. (2)  Choose the menu “Mode : Process Only”.
  60.  
  61. (3)  With the Option key down, choose the menu “File : Process Any File…”. Alternatively, drag the HTML files that you want to convert onto the Add/Strip icon in the Finder.
  62.  
  63. (4)  If you want to convert an HTML file from MacCyrillic to KOI-8, for example, then you convert first with “MacCyrillic –> Unicode# html” and afterwards with “Unicode# –> ISO-IR-111 html”.
  64.  
  65. (5)  You can specify the character set of an HTML file in a META header:
  66. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=x-mac-cyrillic">
  67. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-ir-111">
  68. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-5">
  69. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=windows-1251">
  70. <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ibm866">
  71.  
  72.  
  73.  
  74. Please read first the documentation that comes with Add/Strip before you ask me any further questions!
  75.  
  76.  
  77.  
  78. September 1997
  79. Andreas Prilop
  80. <mailto:pri@mac1.rrzn.uni-hannover.de>
  81.